429 research outputs found

    Evaluation of a Grammar of French Determiners

    Get PDF
    Existing syntactic grammars of natural languages, even with a far from complete coverage, are complex objects. Assessments of the quality of parts of such grammars are useful for the validation of their construction. We evaluated the quality of a grammar of French determiners that takes the form of a recursive transition network. The result of the application of this local grammar gives deeper syntactic information than chunking or information available in treebanks. We performed the evaluation by comparison with a corpus independently annotated with information on determiners. We obtained 86% precision and 92% recall on text not tagged for parts of speech.Comment: 10 page

    Le lexique-grammaire est-il exploitable pour le traitement des langues ?

    Get PDF
    The Lexicon-Grammar of French is a dictionary with structured syntactic-semantic information. In order to assess its exploitability in language processing, we survey four criteria: readability, degree of formalisation, degree of validity of information content, and richness in information. We contribute concrete examples to inform this discussion. We compare the significance of the criteria, in order to evaluate the validity of the priorities retained and of the compromises adopted in the course of the construction of the Lexicon-Grammar.Le lexique-grammaire du français est un dictionnaire contenant des informations syntaxico-sémantiques structurées. Pour évaluer son exploitabilité dans le traitement des langues, nous passons en revue quatre critères : sa lisibilité, son degré de formalisation, le degré de validité de son contenu informatif, et sa richesse en informations. Nous proposons des exemples concrets susceptibles d'éclairer le débat sur cette question. Nous pesons l'importance de ces critères, afin d'évaluer la validité des priorités retenues et des compromis adoptés tout au long de l'élaboration du lexique-grammaire

    Acceptability as the source of syntactic knowledge

    Get PDF
    Special issue on Lexicon-Grammar. Beijing: Institute of Applied Linguistics. In ChineseInternational audienceIn order to construct any representation of the syntax or of the vocabulary of a language, we must first know where information about syntax and semantics is to be found. The point of view of Lexicon-Grammar in this regard is that the source of knowledge lies in experimentation. We will therefore examine the experimental side of syntax and semantics. Most of this paper is based on M. Gross (1984, 1988, 1992, 1994)

    Concordanciers et flexion automatique

    Get PDF
    International audienceConcordancers et automatic inflection. More and more linguists use concordancers to extract words or phrases in context from pre-existing texts. We make a survey on how concordances are used. We discuss the main criteria of quality for choosing a concordancer for a particular use. The goal of this paper is to examine in more detail those that generate lemmatised concordances, i.e. concordances gathering the various inflected forms of a word. This technical feature is in practice specific to concordancers containing a dictionary. An automatic operation on dictionaries, inflection, is indispensable to maintain, and sometimes to operate, this type of concordancer. We explain the basics about automatic inflection and what it implies for a lexicologist. We describe a tried and tested method of automatic inflection.. This type of concordancer, in turn, is useful to lexicologists, among others.Des linguistes de plus en plus nombreux utilisent des concordanciers pour extraire de textes préexistants des mots ou expressions en contexte. Nous passons en revue les utilisations des concordances. Nous nous intéressons aux principaux critères de qualité qui permettent de choisir un concordancier satisfaisant pour un usage donné. L'objectif de cet article est d'examiner plus particulièrement ceux qui produisent des concordances lemmatisées, c'est-à-dire qui regroupent les différentes formes fléchies d'un même mot. Cette caractéristique technique est pratiquement réservée aux concordanciers avec dictionnaire. Un traitement sur les dictionnaires, la flexion automatique, est indispensable à la maintenance, et parfois au fonctionnement, des concordanciers de ce type. Nous expliquons en quoi consiste ce traitement et ce qu'il implique pour le lexicologue. Nous présentons une méthode éprouvée de flexion automatique. Un tel concordancier, à son tour, est utile, entre autres, aux lexicologues

    Exemples attestés et exemples construits dans la pratique du lexique-grammaire

    Get PDF
    National audienceCroft (1993) contrasts an 'experimental method' with an 'observational method', thus renewing the discussion between introspective linguistics and corpus linguistics, by suggesting a parallel with experimental sciences, which these terms come from. The example of lexicon-grammar, a method of syntactic-semantic description constructed with explicit reference to experimental sciences, confirms that formulating rules in accordance with the real usage of a language is not only a matter of observing examples, but also that it nevertheless requires intensive observation of examples, as well as rigorous methodological precautions in this observation. Thus, the apparently opposed traditions of introspective linguistics and of corpus linguistics are complementary and should be combined for the success of such an enterprise. These thoughts are an invitation for linguists to overcome their historical resistance to combining both types of methods.Similarly, in natural language processing, most of the community sticks to the stochastic approach, which amounts to giving up co-operation between computer technology and descriptive linguistics.L'opposition de Croft (1998) entre " méthode expérimentale " et " méthode observationnelle " renouvelle le vieux débat entre linguistique introspective et linguistique de corpus, en suscitant un parallèle avec les sciences expérimentales, auxquelles Croft emprunte ces termes. L'exemple du lexique-grammaire, une méthode de description syntaxico-sémantique dont les fondements se réfèrent explicitement aux sciences expérimentales, confirme, s'il en était besoin, que la formulation de règles conformes à la réalité de l'usage d'une langue ne se résume pas à une simple observation d'exemples. Toutefois, elle nécessite une observation intensive d'exemples, ainsi que des précautions méthodologiques rigoureuses dans cette activité d'observation. Les traditions apparemment opposées de la linguistique introspective et de la linguistique de corpus sont donc complémentaires et de nature à se combiner pour favoriser le succès d'une telle entreprise. Ces réflexions invitent les linguistes à surmonter leur réticence historique à combiner les deux types de méthodes.De même, en traitement automatique des langues, la majeure partie de la communauté en reste à l'abordage probabiliste, renonçant à faire collaborer l'informatique appliquée avec la linguistique descriptive

    Graphes paramétrés et lexique-grammaire

    Get PDF
    Unpublished conference electronic version (5 pp.)National audienceIGM's project of a formal syntactic and semantic representation of the French lexicon and grammar has several specific features. The first one is of historical nature. It relies on a preexisting set of lexical, syntactic and semantic data, the French lexicon-grammar. The tabular form of lexicon-grammars as described in literature (Gross, 1994) is designed for construction by lexicographers, reading and manual update. Exploitation for language processing requires a slightly different form, which we will call a 'grammar form'. Another specific feature of lexicon-grammars is the simplicity of the underlying syntactic formalism (cf. Harris, 1976). Such intended simplicity is meant to avoid adding upon the inherent complexity of the lexicon/grammar interface any additional, artificial complexity.Le projet de représentation formelle syntaxique et sémantique du lexique et de la grammaire du français à l'IGM présente plusieurs spécificités. La première est historique. Elle repose sur un ensemble préexistant de données lexicales, syntaxiques et sémantiques, le lexique-grammaire du français. La forme tabulaire du lexique-grammaire telle qu'elle est décrite dans la littérature (Gross 1994) est conçue pour la construction par les lexicographes, la lecture, la maintenance manuelle. L'exploitation pour le traitement automatique des langues nécessite une forme un peu différente, que nous appellerons une "forme grammaire". Une autre spécificité du lexique-grammaire est la simplicité du formalisme syntaxique sous-jacent (cf. Harris, 1976). Cette simplicité est un parti pris volontaire, elle vise à ne pas ajouter à la complexité inhérente de l'interface lexique/grammaire une complexité artificielle supplémentaire

    Dictionaries for language processing. Readability and organization of information

    Get PDF
    What makes a dictionary exploitable in Natural Language Processing (NLP)? We examine two requirements: readability of information and general architecture, and we focus on the human tasks involving NLP dictionaries: construction, update, check, correction. We exemplify our points with real cases from projects of morpho-syntactic or syntactic-semantic dictionaries.Quelles caractéristiques d'un dictionnaire le rendent exploitable pour le traitement automatique des langues (TAL) ? Nous examinons deux exigences : la lisibilité des informations et l'architecture générale, et nous nous concentrons sur les tâches humaines concernées par les dictionnaires pour le TAL : construction, mise à jour, vérification, correction. Nous illustrons nos arguments par des exemples de cas réels tirés de projets de dictionnaires morpho-syntaxiques ou syntactico-sémantiques
    • …
    corecore